Predicción pre-intervención de efectos secundarios en steering de SAE
Aprende a predecir los efectos secundarios del steering con autoencoders dispersos. Un estudio en GPT-2, Pythia, Gemma y Llama para optimizar tu intervención.
Aprende a predecir los efectos secundarios del steering con autoencoders dispersos. Un estudio en GPT-2, Pythia, Gemma y Llama para optimizar tu intervención.
¿Tu agente de IA envió dos veces el mismo correo? Descubre por qué ocurre y cómo solucionarlo con idempotencia. Guía práctica con ejemplos reales.